Progetto CPS COVID-2


Authors: Giuseppe Lasco & Marco Marcucci

Group Name: Carbonara&Firricidd


Lo scopo del progetto consiste nel rielaborare il dataset "time_series_covid19_confirmed_global.csv", in modo da trasformarlo in uno più utile al nostro scopo, per poi confrontare, attraverso l'utilizzo di più grafici, l'andamento dei nuovi casi giornalieri di persone affette da covid-19, globalmente e non.

Di seguito l'import delle librerie utilizzate:

Il primo passo consiste nel reperire il dataset "time_series_covid19_confirmed_global.csv" da GitHub.

La funzione preprocessing() permette di manipolare il dataset recuperato trasformandolo nel dataset richiesto. Se viene settato a True il parametro world, viene costruito il dataset cumulativo mondiale, anziché per paese.

Di seguito un summary del dataset richiesto:

Di seguito un summary del dataset cumulativo mondiale:

La seguente funzione permette di graficare l'andamento dei "New Confirmed" di un daterminato paese.

Si è notata una discordanza dei dati di alcuni paesi, tra cui la Francia. Il numero dei Confirmed in una certa data, a volte, risulta inferiore rispetto al giorno precedente. Questo fenomeno provoca la comparsa di numeri negativi tra i New Confirmed.

Considerando che i Confirmed sono i casi totali dall'inizio della pandemia, ci si aspetterebbe dei dati sempre crescenti all'aumentare dei giorni.

Di seguito il grafico dei New Confirmed relativi alla Francia:

La seguente funzione permette di graficare l'andamento dei "New Confirmed", di un daterminato paese, calcolati in media mobile semplice a 7, 14, 21 e 28 giorni.

La funzione european_country_comparison() permette di confrontare i grafici dell'andamento dei "New Confirmed", dei paesi Italia, Germania, Francia e Inghilterra, calcolati in media mobile semplice a 14 giorni; questo per permettere una miglior visualizzazione dei risultati. Il grafico della media mobile permette di evidenziare il trend della serie temporale, epurandolo dalle fluttuazioni giornaliere. È comunque possibile scegliere un valore differente di giorni da applicare alla media mobile (parametro sma), se settato a uno non viene applicata.

La funzione seguente permette di graficare l'andamento dei "New Confirmed" mondiali, calcolati in media mobile semplice a 30 giorni.

La funzione histogram_one_day() grafica l'andamento dei "New Confirmed" di ciascun paese, in una specifica data.